NumPy: матрицы и операции над ними


В этом ноутбуке из сторонних библиотек нам понадобится только NumPy. Для удобства импортируем ее под более коротким именем:


In [1]:
import numpy as np

1. Создание матриц

Приведем несколько способов создания матриц в NumPy.

Самый простой способ — с помощью функции numpy.array(list, dtype=None, ...).

В качестве первого аргумента ей надо передать итерируемый объект, элементами которого являются другие итерируемые объекты одинаковой длины и содержащие данные одинакового типа.

Второй аргумент является опциональным и определяет тип данных матрицы. Его можно не задавать, тогда тип данных будет определен из типа элементов первого аргумента. При задании этого параметра будет произведена попытка приведения типов.

Например, матрицу из списка списков целых чисел можно создать следующим образом:


In [2]:
a = np.array([[1, 2, 3], [2, 5, 6], [6, 7, 4]])
print "Матрица:\n", a


Матрица:
[[1 2 3]
 [2 5 6]
 [6 7 4]]

Второй способ создания — с помощью встроенных функций numpy.eye(N, M=None, ...), numpy.zeros(shape, ...), numpy.ones(shape, ...).

Первая функция создает единичную матрицу размера $N \times M$; если $M$ не задан, то $M = N$.

Вторая и третья функции создают матрицы, состоящие целиком из нулей или единиц соответственно. В качестве первого аргумента необходимо задать размерность массива — кортеж целых чисел. В двумерном случае это набор из двух чисел: количество строк и столбцов матрицы.

Примеры:


In [3]:
b = np.eye(5)
print "Единичная матрица:\n", b


Единичная матрица:
[[ 1.  0.  0.  0.  0.]
 [ 0.  1.  0.  0.  0.]
 [ 0.  0.  1.  0.  0.]
 [ 0.  0.  0.  1.  0.]
 [ 0.  0.  0.  0.  1.]]

In [4]:
c = np.ones((7, 5))
print "Матрица, состоящая из одних единиц:\n", c


Матрица, состоящая из одних единиц:
[[ 1.  1.  1.  1.  1.]
 [ 1.  1.  1.  1.  1.]
 [ 1.  1.  1.  1.  1.]
 [ 1.  1.  1.  1.  1.]
 [ 1.  1.  1.  1.  1.]
 [ 1.  1.  1.  1.  1.]
 [ 1.  1.  1.  1.  1.]]

Обратите внимание: размерность массива задается не двумя аргументами функции, а одним — кортежем!

Вот так — np.ones(7, 5) — создать массив не получится, так как функции в качестве параметра shape передается 7, а не кортеж (7, 5).

И, наконец, третий способ — с помощью функции numpy.arange([start, ]stop, [step, ], ...), которая создает одномерный массив последовательных чисел из промежутка [start, stop) с заданным шагом step, и метода array.reshape(shape).

Параметр shape, как и в предыдущем примере, задает размерность матрицы (кортеж чисел). Логика работы метода ясна из следующего примера:


In [5]:
v = np.arange(0, 24, 2)
print "Вектор-столбец:\n", v


Вектор-столбец:
[ 0  2  4  6  8 10 12 14 16 18 20 22]

In [6]:
d = v.reshape((3, 4))
print "Матрица:\n", d


Матрица:
[[ 0  2  4  6]
 [ 8 10 12 14]
 [16 18 20 22]]

Более подробно о том, как создавать массивы в NumPy, см. документацию.

2. Индексирование

Для получения элементов матрицы можно использовать несколько способов. Рассмотрим самые простые из них.

Для удобства напомним, как выглядит матрица d:


In [7]:
print "Матрица:\n", d


Матрица:
[[ 0  2  4  6]
 [ 8 10 12 14]
 [16 18 20 22]]

Элемент на пересечении строки i и столбца j можно получить с помощью выражения array[i, j].

Обратите внимание: строки и столбцы нумеруются с нуля!


In [8]:
print "Второй элемент третьей строки матрицы:", d[2, 1]


Второй элемент третьей строки матрицы: 18

Из матрицы можно получать целые строки или столбцы с помощью выражений array[i, :] или array[:, j] соответственно:


In [9]:
print "Вторая строка матрицы d:\n", d[1, :]
print "Четвертый столбец матрицы d:\n", d[:, 3]


Вторая строка матрицы d:
[ 8 10 12 14]
Четвертый столбец матрицы d:
[ 6 14 22]

Еще один способ получения элементов — с помощью выражения array[list1, list2], где list1, list2 — некоторые списки целых чисел. При такой адресации одновременно просматриваются оба списка и возвращаются элементы матрицы с соответствующими координатами. Следующий пример более понятно объясняет механизм работы такого индексирования:


In [10]:
print "Элементы матрицы d с координатами (1, 2) и (0, 3):\n", d[[1, 0], [2, 3]]


Элементы матрицы d с координатами (1, 2) и (0, 3):
[12  6]

Более подробно о различных способах индексирования в массивах см. документацию.

3. Векторы, вектор-строки и вектор-столбцы

Следующие два способа задания массива кажутся одинаковыми:


In [11]:
a = np.array([1, 2, 3])
b = np.array([[1], [2], [3]])

Однако, на самом деле, это задание одномерного массива (то есть вектора) и двумерного массива:


In [12]:
print "Вектор:\n", a
print "Его размерность:\n", a.shape
print "Двумерный массив:\n", b
print "Его размерность:\n", b.shape


Вектор:
[1 2 3]
Его размерность:
(3,)
Двумерный массив:
[[1]
 [2]
 [3]]
Его размерность:
(3, 1)

Обратите внимание: вектор (одномерный массив) и вектор-столбец или вектор-строка (двумерные массивы) являются различными объектами в NumPy, хотя математически задают один и тот же объект. В случае одномерного массива кортеж shape состоит из одного числа и имеет вид (n,), где n — длина вектора. В случае двумерных векторов в shape присутствует еще одна размерность, равная единице.

В большинстве случаев неважно, какое представление использовать, потому что часто срабатывает приведение типов. Но некоторые операции не работают для одномерных массивов. Например, транспонирование (о нем пойдет речь ниже):


In [13]:
a = a.T
b = b.T

In [14]:
print "Вектор не изменился:\n", a
print "Его размерность также не изменилась:\n", a.shape
print "Транспонированный двумерный массив:\n", b
print "Его размерность изменилась:\n", b.shape


Вектор не изменился:
[1 2 3]
Его размерность также не изменилась:
(3,)
Транспонированный двумерный массив:
[[1 2 3]]
Его размерность изменилась:
(1, 3)

4. Умножение матриц и столбцов

Напоминание теории. Операция умножения определена для двух матриц, таких что число столбцов первой равно числу строк второй.

Пусть матрицы $A$ и $B$ таковы, что $A \in \mathbb{R}^{n \times k}$ и $B \in \mathbb{R}^{k \times m}$. Произведением матриц $A$ и $B$ называется матрица $C$, такая что $c_{ij} = \sum_{r=1}^{k} a_{ir}b_{rj}$, где $c_{ij}$ — элемент матрицы $C$, стоящий на пересечении строки с номером $i$ и столбца с номером $j$.

В NumPy произведение матриц вычисляется с помощью функции numpy.dot(a, b, ...) или с помощью метода array1.dot(array2), где array1 и array2 — перемножаемые матрицы.


In [15]:
a = np.array([[1, 0], [0, 1]])
b = np.array([[4, 1], [2, 2]])
r1 = np.dot(a, b)
r2 = a.dot(b)

In [16]:
print "Матрица A:\n", a
print "Матрица B:\n", b
print "Результат умножения функцией:\n", r1
print "Результат умножения методом:\n", r2


Матрица A:
[[1 0]
 [0 1]]
Матрица B:
[[4 1]
 [2 2]]
Результат умножения функцией:
[[4 1]
 [2 2]]
Результат умножения методом:
[[4 1]
 [2 2]]

Матрицы в NumPy можно умножать и на векторы:


In [17]:
c = np.array([1, 2])
r3 = b.dot(c)

In [18]:
print "Матрица:\n", b
print "Вектор:\n", c
print "Результат умножения:\n", r3


Матрица:
[[4 1]
 [2 2]]
Вектор:
[1 2]
Результат умножения:
[6 6]

Обратите внимание: операция * производит над матрицами покоординатное умножение, а не матричное!


In [19]:
r = a * b

In [20]:
print "Матрица A:\n", a
print "Матрица B:\n", b
print "Результат покоординатного умножения через операцию *:\n", r


Матрица A:
[[1 0]
 [0 1]]
Матрица B:
[[4 1]
 [2 2]]
Результат покоординатного умножения через операцию *:
[[4 0]
 [0 2]]

Более подробно о матричном умножении в NumPy см. документацию.

5. Транспонирование матриц

Напоминание теории. Транспонированной матрицей $A^{T}$ называется матрица, полученная из исходной матрицы $A$ заменой строк на столбцы. Формально: элементы матрицы $A^{T}$ определяются как $a^{T}_{ij} = a_{ji}$, где $a^{T}_{ij}$ — элемент матрицы $A^{T}$, стоящий на пересечении строки с номером $i$ и столбца с номером $j$.

В NumPy транспонированная матрица вычисляется с помощью функции numpy.transpose() или с помощью метода array.T, где array — нужный двумерный массив.


In [21]:
a = np.array([[1, 2], [3, 4]])
b = np.transpose(a)
c = a.T

In [22]:
print "Матрица:\n", a
print "Транспонирование функцией:\n", b
print "Транспонирование методом:\n",  c


Матрица:
[[1 2]
 [3 4]]
Транспонирование функцией:
[[1 3]
 [2 4]]
Транспонирование методом:
[[1 3]
 [2 4]]

См. более подробно о numpy.transpose() и array.T в NumPy.

В следующих разделах активно используется модуль numpy.linalg, реализующий некоторые приложения линейной алгебры. Более подробно о функциях, описанных ниже, и различных других функциях этого модуля можно посмотреть в его документации.

6. Определитель матрицы

Напоминание теории. Для квадратных матриц существует понятие определителя.

Пусть $A$ — квадратная матрица. Определителем (или детерминантом) матрицы $A \in \mathbb{R}^{n \times n}$ назовем число

$$\det A = \sum_{\alpha_{1}, \alpha_{2}, \dots, \alpha_{n}} (-1)^{N(\alpha_{1}, \alpha_{2}, \dots, \alpha_{n})} \cdot a_{\alpha_{1} 1} \cdot \cdot \cdot a_{\alpha_{n} n}, $$

где $\alpha_{1}, \alpha_{2}, \dots, \alpha_{n}$ — перестановка чисел от $1$ до $n$, $N(\alpha_{1}, \alpha_{2}, \dots, \alpha_{n})$ — число инверсий в перестановке, суммирование ведется по всем возможным перестановкам длины $n$.

Не стоит расстраиваться, если это определение понятно не до конца — в дальнейшем в таком виде оно не понадобится.

Например, для матрицы размера $2 \times 2$ получается:

$$\det \left( \begin{array}{cc} a_{11} & a_{12} \\ a_{21} & a_{22} \end{array} \right) = a_{11} a_{22} - a_{12} a_{21} $$

Вычисление определителя матрицы по определению требует порядка $n!$ операций, поэтому разработаны методы, которые позволяют вычислять его быстро и эффективно.

В NumPy определитель матрицы вычисляется с помощью функции numpy.linalg.det(a), где a — исходная матрица.


In [23]:
a = np.array([[1, 2, 1], [1, 1, 4], [2, 3, 6]], dtype=np.float32)
det = np.linalg.det(a)

In [24]:
print "Матрица:\n", a
print "Определитель:\n", det


Матрица:
[[ 1.  2.  1.]
 [ 1.  1.  4.]
 [ 2.  3.  6.]]
Определитель:
-1.0

Рассмотрим одно интересное свойство определителя. Пусть у нас есть параллелограмм с углами в точках $(0, 0), (c,d), (a+c, b+d), (a, b)$ (углы даны в порядке обхода по часовой стрелке). Тогда площадь этого параллелограмма можно вычислить как модуль определителя матрицы $\left( \begin{array}{cc} a & c \\ b & d \end{array} \right)$. Похожим образом можно выразить и объем параллелепипеда через определитель матрицы размера $3 \times 3$.

7. Ранг матрицы

Напоминание теории. Рангом матрицы $A$ называется максимальное число линейно независимых строк (столбцов) этой матрицы.

В NumPy ранг матрицы вычисляется с помощью функции numpy.linalg.matrix_rank(M, tol=None), где M — матрица, tol — параметр, отвечающий за некоторую точность вычисления. В простом случае можно его не задавать, и функция сама определит подходящее значение этого параметра.


In [25]:
a = np.array([[1, 2, 3], [1, 1, 1], [2, 2, 2]])
r = np.linalg.matrix_rank(a)

In [26]:
print "Матрица:\n", a
print "Ранг матрицы:", r


Матрица:
[[1 2 3]
 [1 1 1]
 [2 2 2]]
Ранг матрицы: 2

С помощью вычисления ранга матрицы можно проверять линейную независимость системы векторов.

Допустим, у нас есть несколько векторов. Составим из них матрицу, где наши векторы будут являться строками. Понятно, что векторы линейно независимы тогда и только тогда, когда ранг полученной матрицы совпадает с числом векторов. Приведем пример:


In [27]:
a = np.array([1, 2, 3])
b = np.array([1, 1, 1])
c = np.array([2, 3, 5])
m = np.array([a, b, c])

In [28]:
print np.linalg.matrix_rank(m) == m.shape[0]


True

8. Системы линейных уравнений

Напоминание теории. Системой линейных алгебраических уравнений называется система вида $Ax = b$, где $A \in \mathbb{R}^{n \times m}, x \in \mathbb{R}^{m \times 1}, b \in \mathbb{R}^{n \times 1}$. В случае квадратной невырожденной матрицы $A$ решение системы единственно.

В NumPy решение такой системы можно найти с помощью функции numpy.linalg.solve(a, b), где первый аргумент — матрица $A$, второй — столбец $b$.


In [29]:
a = np.array([[3, 1], [1, 2]])
b = np.array([9, 8])
x = np.linalg.solve(a, b)

In [30]:
print "Матрица A:\n", a
print "Вектор b:\n", b
print "Решение системы:\n", x


Матрица A:
[[3 1]
 [1 2]]
Вектор b:
[9 8]
Решение системы:
[ 2.  3.]

Убедимся, что вектор x действительно является решением системы:


In [31]:
print a.dot(x)


[ 9.  8.]

Бывают случаи, когда решение системы не существует. Но хотелось бы все равно "решить" такую систему. Логичным кажется искать такой вектор $x$, который минимизирует выражение $\left\Vert Ax - b\right\Vert^{2}$ — так мы приблизим выражение $Ax$ к $b$.

В NumPy такое псевдорешение можно искать с помощью функции numpy.linalg.lstsq(a, b, ...), где первые два аргумента такие же, как и для функции numpy.linalg.solve(). Помимо решения функция возвращает еще три значения, которые нам сейчас не понадобятся.


In [32]:
a = np.array([[0, 1], [1, 1], [2, 1], [3, 1]])
b = np.array([-1, 0.2, 0.9, 2.1])
x, res, r, s = np.linalg.lstsq(a, b)

In [33]:
print "Матрица A:\n", a
print "Вектор b:\n", b
print "Псевдорешение системы:\n", x


Матрица A:
[[0 1]
 [1 1]
 [2 1]
 [3 1]]
Вектор b:
[-1.   0.2  0.9  2.1]
Псевдорешение системы:
[ 1.   -0.95]

9. Обращение матриц

Напоминание теории. Для квадратных невырожденных матриц определено понятие обратной матрицы.

Пусть $A$ — квадратная невырожденная матрица. Матрица $A^{-1}$ называется обратной матрицей к $A$, если

$$AA^{-1} = A^{-1}A = I, $$

где $I$ — единичная матрица.

В NumPy обратные матрицы вычисляются с помощью функции numpy.linalg.inv(a), где a — исходная матрица.


In [34]:
a = np.array([[1, 2, 1], [1, 1, 4], [2, 3, 6]], dtype=np.float32)
b = np.linalg.inv(a)

In [35]:
print "Матрица A:\n", a
print "Обратная матрица к A:\n", b
print "Произведение A на обратную должна быть единичной:\n", a.dot(b)


Матрица A:
[[ 1.  2.  1.]
 [ 1.  1.  4.]
 [ 2.  3.  6.]]
Обратная матрица к A:
[[ 6.  9. -7.]
 [-2. -4.  3.]
 [-1. -1.  1.]]
Произведение A на обратную должна быть единичной:
[[ 1.  0.  0.]
 [ 0.  1.  0.]
 [ 0.  0.  1.]]

10. Собственные числа и собственные вектора матрицы

Напоминание теории. Для квадратных матриц определены понятия собственного вектора и собственного числа.

Пусть $A$ — квадратная матрица и $A \in \mathbb{R}^{n \times n}$. Собственным вектором матрицы $A$ называется такой ненулевой вектор $x \in \mathbb{R}^{n}$, что для некоторого $\lambda \in \mathbb{R}$ выполняется равенство $Ax = \lambda x$. При этом $\lambda$ называется собственным числом матрицы $A$. Собственные числа и собственные векторы матрицы играют важную роль в теории линейной алгебры и ее практических приложениях.

В NumPy собственные числа и собственные векторы матрицы вычисляются с помощью функции numpy.linalg.eig(a), где a — исходная матрица. В качестве результата эта функция выдает одномерный массив w собственных чисел и двумерный массив v, в котором по столбцам записаны собственные вектора, так что вектор v[:, i] соотвествует собственному числу w[i].


In [36]:
a = np.array([[-1, -6], [2, 6]])
w, v = np.linalg.eig(a)

In [37]:
print "Матрица A:\n", a
print "Собственные числа:\n", w
print "Собственные векторы:\n", v


Матрица A:
[[-1 -6]
 [ 2  6]]
Собственные числа:
[ 2.  3.]
Собственные векторы:
[[-0.89442719  0.83205029]
 [ 0.4472136  -0.5547002 ]]

Обратите внимание: у вещественной матрицы собственные значения или собственные векторы могут быть комплексными.

11. Комплексные числа в питоне

Внимание: данный материал является дополнительным — его изучение не является необходимым для выполнения тестов.

Напоминание теории. Комплексными числами называются числа вида $x + iy$, где $x$ и $y$ — вещественные числа, а $i$ — мнимая единица (величина, для которой выполняется равенство $i^{2} = -1$). Множество всех комплексных чисел обозначается буквой $\mathbb{C}$ (подробнее про комплексные числа см. википедию).

В питоне комплескные числа можно задать следующим образом (j обозначает мнимую единицу):


In [38]:
a = 3 + 2j
b = 1j

In [39]:
print "Комплексное число a:\n", a
print "Комплексное число b:\n", b


Комплексное число a:
(3+2j)
Комплексное число b:
1j

С комплексными числами в питоне можно производить базовые арифметические операции так же, как и с вещественными числами:


In [40]:
c = a * a
d = a / (4 - 5j)

In [41]:
print "Комплексное число c:\n", c
print "Комплексное число d:\n", d


Комплексное число c:
(5+12j)
Комплексное число d:
(0.0487804878049+0.560975609756j)